文章目录
  1. 1. 维度表特性
    1. 1.1. 代理键
    2. 1.2. 自然键
    3. 1.3. 丰富的维度集合

本博客重点总结第三章基本原理中的维度表特性。

维度表特性

代理键

星型模式中,每个维度表都分配有一个代理键。代理键仅仅是为数据仓库和数据集市创建的。代理键通常表现为整数,在星型模式加载时的获取、转换、加载(ETL)过程中产生并被管理。键值不包含内在的含义,因此对数据仓库使用者来说并无特殊的意义。维度表的每一行都包含一个唯一的代理键与之对应。将代理键作为唯一标识符的使用方法允许数据仓库对源系统发生的变化做出响应,这种方式适应了分析型系统的需求。由于维度表不依赖于自然键来区分行的唯一性,因此维度表能够维护历史信息,即使源系统不能也无所谓。为每个维度表分配一个代理键,用于唯一地区分表中的每行记录。

自然键

与代理键不同,多数维度表中都包含一个或多个自然键。自然键通常来源于源系统。它们不能唯一地区分数据仓库中的行,但能够区分来自源系统中对应的实体。与代理键键值不同,自然键键值对数据仓库使用者来说可能包含一定的意义。即使自然键不具有明确的含义,用于加载事实表的ETL例程也仍然需要它们。有时维度表的自然键包含多个列。这种情况通常发生在源系统采用多键方式区分实体时。
替换代理键的方法之一是为自然键附加一个序列号。
另外一种理论上可以替换代理键的方法是为自然键增加一个时间戳。

丰富的维度集合

维度为事实提供了环境,没有环境,事实就无法理解。维度以及维度值在多个方面增强了事实的含义:

  1. 用于过滤查询或报表。
  2. 用于控制聚集事实的范围。
  3. 用于确定信息的顺序或排序。
  4. 与事实一起构成提供报表的环境。
  5. 用于定义主从结构、分组、分类汇总、汇总等。
    在查询中可以使用维度的不同组合方式回答各种问题。维度涉及的属性越广,对事实表开展分析工作的方式就越多。
    提供丰富和全面的维度属性集合,每个新增的属性都将会显著地提高分析的可能性。
    若一个属性通常用于聚集或汇总,那它就是事实。有时作为维度的数字型属性不易识别,如价格单位,它可以用于对订单进行分组:如“以12美元或10美元分别卖了多少?”因此,此时价格单位将被划分为维度。
    数字型数据是维度还是事实通常并不容易区分。在出现疑问时,一定要注意应根据应用情况分析。如果一个元素值用于过滤查询、排序数据、控制聚集、区分主从关系等,该元素通常是维度。数量单位一般是维度,数量汇总一般是事实。数量单位乘以事务数量产生的结果可以被聚集和汇总,是事实。数量单位是有用的维度,数量汇总是有用的事实。它们在维度设计中具有不同的作用。
    基于事实计算得到的维度成为行为维度。
文章目录
  1. 1. 维度表特性
    1. 1.1. 代理键
    2. 1.2. 自然键
    3. 1.3. 丰富的维度集合